یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

Authors

محمد اصلانی

m. aslani faculty of geodesy and geomatics eng. k.n.toosi university of technology no 1346, valiasr street, mirdamad cross, tehran, iranگروه مهندسی gis، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی تهران، خیابان ولی عصر، تقاطع میرداماد، محمد سعدی مسگری

m. s. mesgari faculty of geodesy and geomatics eng. k.n.toosi university of technology no 1346, valiasr street, mirdamad cross, tehran, iranگروه مهندسی gis، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی تهران، خیابان ولی عصر، تقاطع میرداماد، حمید مطیعیان

h. motieyan faculty of geodesy and geomatics eng. k.n.toosi university of technology no 1346, valiasr street, mirdamad cross, tehran, iranگروه مهندسی gis، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی تهران، خیابان ولی عصر، تقاطع میرداماد،

abstract

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت کردن افزایش تقاضای سفر و جلوگیری از ترافیک شهری، افزایش کارایی زیر ساخت های موجود از طریق سیستم های هوشمند کنترل ترافیک می باشد. از سوی دیگر کنترل ترافیک به دلیل طبیعت توزیع یافته و خودمختار آن توسط سیستم های چند عامله به خوبی قابل مدلسازی می باشد. رانندگان و چراغ های راهنمایی را می توان به عنوان عامل هایی که رفتارهای هوشمندانه ای از خود نشان می دهند در نظر گرفت. برای ایجاد چنین رفتارهایی نیاز است که دانش لازمه از محیط اطراف در ذهن عامل قرار داده شود اما به دلیل پیچیدگی های بالای موجود در الگوهای ترافیک شهری و ناایستا بودن اغلب محیط های ترافیکی قرار دادن یک دانش اولیه از محیط در ذهن عامل ها بسیار دشوار و غیر عملی می باشد. بنابراین نیاز به یک روشی که عامل در طول تعامل با محیط بتواند دانش لازمه را بدست آورد کاملاً ضروری است که در این تحقیق برای حل این چالش از یادگیری تقویتی استفاده شد. هدف مقاله حاضر بهبود استراتژی های کنترل ترافیک و به طور خاص کنترل هوشمند چراغ های راهنمایی از طریق توسعه تکنیک های یادگیری تقویتی در سیستم های چند عامله است. معماری عملگر – نقاد به عنوان یک معماری رایج در یادگیری تقویتی که دارای ساختار حافظه جداگانه ای هم برای سیاست و هم برای تابع ارزش است مورد استفاده قرار گرفت. نتایج این تحقیق نشان دادند که کنترل هوشمند چراغ های راهنمایی منجر به کاهش 23% طول صف و 16% زمان سفر نسبت به کنترل غیر هوشمند چراغ های راهنمایی برای یک تقاطع منفرد می شود.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

توسعه سامانه‌های چند عامله و یادگیری تقویتی در کنترل هوشمند چراغ‌های راهنمایی

امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیب‌های مختلف اقتصادی، محیط زیستی و اجتماعی می‌شود. برای جلوگیری از این آسیب‌ها، نیاز به بهبود زیر ساخت‌های فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس می‌شود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغ‌های راهنمایی به عنوان یکی از شاخه‌های سیستم‌های حمل و نقل هوشمند با استفاده از سامانه‌های چند عامله یادگی...

full text

توسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله

در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...

15 صفحه اول

توسعه کنترلر هوشمند چراغ‌های راهنمایی بر پایه یادگیری تقویتی حالت پیوسته در محیط ترافیکی میکروسکوپیک

افزایش روزافزون تعداد خودروها و در پی آن ترافیک‌های سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را به‌خوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغ‌های راهنمایی بر پایه یادگیری تقو...

full text

سیستم چند عامله برای کنترل ترافیک هوایی و مدیریت موقعیت های اضطراری هواپیما

چکیده توسعه روزافزون جوامع بشری، گسترش سریع حمل و نقل هوایی را به دنبال داشته است. امروزه مدیریت ترافیک هوایی به مسئله پیچیده ای تبدیل گردیده که دانشمندان علاقه مند به حل آن می باشند. فشار زیاد کاری مراقبین پرواز، افزایش موقعیت های اضطراری پرواز، هواپیما ربایی، محدودیت فضای آزاد و غیر قابل پیش بینی بودن آن، نیاز به استقلال عمل، خودمختاری، اجازه دادن برای مسیر یابی و پیشگیری از تصادم را در مدیر...

15 صفحه اول

My Resources

Save resource for easier access later


Journal title:
علوم و فنون نقشه برداری

جلد ۵، شماره ۳، صفحات ۲۳۳-۲۴۶

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023